# from docx import Document
# # 创建一个新的Document对象
# doc = Document()

# # 添加段落
# doc.add_paragraph('这是一个新的段落。')

# # 保存文档
# doc.save('new_document.docx')

from pdf2image import convert_from_path
from docx import Document
from docx.shared import Inches

def pdf_to_word_with_images(pdf_path, word_path):
    # 将PDF转换为图片列表
    images = convert_from_path(
      pdf_path = pdf_path
    )
    
    # 创建一个Word文档
    doc = Document()
    
    for i, image in enumerate(images):
        # 将图片保存为文件
        image_path = f'docs/cache/page_{i+1}.png'
        image.save(image_path, 'PNG')
        
        # 在Word文档中添加图片
        # page_width = doc.sections[0].page_width  # 获取页面宽度
        # page_height = doc.sections[0].page_height  # 获取页面宽度
        # picture = doc.add_picture(image_path, width=Inches(page_width), height=Inches(page_height))
        # picture.width = int(page_width * 0.8)  # 设置图片宽度为页面宽度的20%
        # picture.height = int(page_height * 0.8)  # 设置图片宽度为页面宽度的20%
        doc.add_picture(image_path, width=Inches(5.0))
    
    # 保存Word文档
    doc.save(word_path)

# 使用函数转换PDF
pdf_to_word_with_images('docs/1.pdf', 'docs/11.docx')